削っ て , 削っ て 
… 最 適 化 設計 
ロジ : (その 1) 


シス テム の 記事 國 ビギナー ズ 


限ら れ た ハー ドウ ェ ア ・ リ ソー ス 上 で 開発 する 組み 込み シス テ 像 処理 を 行う ビデ オ ・ チ ッ プ その も の の 性 能 が 不 十 分 で あ 
ム に お いて ., 最適 化 設 計 を 実施 し て 求め られ る 性 能 を 確保 する る こと も 分 か り ま し た . どの ビデ オ ・ チ ッ プ を 採用 する か 
こと は 必要 不可 欠 な 作業 で ある . 今回 は , CPU の 演算 量 を 減 に 当たっ て は , 当然 各社 の ベン チマ ー ク を と っ て 評価 し た 
ら す こと に より 性 能 を 確保 する 方 法 に つい て 解説 する . の で す が , 評価 方 法 に 問題 が あっ た よう で す . その た め , 
(編集 部 ) 評価 時 の 成績 と 実際 に シス テム を 組み 上 げた と き の 処 理性 
能 と で は , か な り 差 が ある らし いこ と が 分 か り ま し た . 

F さ ん は , 今度 発売 する 新しい 携帯 ゲー ム 機 の 開発 に 携 そう は いっ て も , 今 か ら ビ デオ ・ チ ッ プ を 取り 換え て 開 
わっ て いま す . この ゲー ム 機 ば 3D グ ラフ ィ ッ クス の 立体 発し 直す わけ に は いき ませ ん . 結局 , 3D 描 画 ラ イブ ラリ 

画像 が きめ 細か く て きれ いで ある こと 」 を 売り に し よう と の 最適 化 で な ん と か する こと に な っ て し まい まし た . 
し て いま し た . ゲー ム の 作り 自体 を 変更 し て 3D グ ラフ ィ ッ クス の 描画 

し か し , 開発 も 終盤 に さしかかっ た と ころ で , 思わ ぬ 事 を 簡素 化す る 手 は あり そう で す が , この 手段 を 用 いる と 商 
態 が 生じ まし た . 画面 の 動き が トロ トロ と 遅い の で す . こ 品 価値 に 響 いて し まい ます . また , そもそも 各 ゲ ー ム ・ メ 
れ で は , 迫力 ある 画像 を 楽し む ど ころ か , 描画 を 待つ 時 間 ー カ は ある 程度 開発 を 進め て し まっ て お り , 今さら 後に は 
の イラ イラ の 方 が 大 きく , と て も 商品 と し て 売れ そう に あ 引け ませ ん . F さ ん た ち は 苦 し い 立 場 に 立た され て し まい 
り ま せん . まし た ぜ 1. 

に , 場合 に よっ て は , プレ イ 中 に ゲー ム 自 体 が ハン 

グ ア ッ プ し て し まう こと も ある と 分 か り ま し た . どう や ら , 人 @ 古く て 新しい 「 最 適 化 」 
処理 速度 が り アル タイ ム で は 間に合わ ず , シス テム 全体 が さて , ここ に 挙げ た 例 は 多少 誇張 され て お り , 実際 に こ 
動か な く な っ て し まう の が 原因 の よう で し た . 元凶 は 3D こま で 切羽 詰まっ て か ら 性 熊 処理 速度 と メモ リ 使用 量 ) の 
グラ フィ ックス な の で は な いか , と すぐ に 疑わ れ ま し た . 問題 が クロ ー ズ アッ プ さ れる こと は まれ で ある と 思わ れ ま 
3D 画像 は , ポリ ゴン と 呼ば れる 小さ な 三角 形 で 物体 の 表 す . と は いう も の の , 組み 込み シス テム の 開発 に お いて , 
面 を 覆う よう に し て 表現 し ます . この ポリ ゴン の 数 を 増 や 性 能 が し ば し ば 問題 と な る こと は 事実 で す . 多少 まし ( ? ) 
せ ば 増やす ほど 画像 は きれ い に な り ま す が , 計算 量 が 増え な 開発 で あっ て も , 開発 が 終盤 に さしかかっ て か ら 処 理 量 
る た め , その 分 描画 に 時 間 が か か る よう に な り ま す . を くっ て いる 犯人 探し 」 が 始ま る ケー ス な ら , 枚挙 に いと 


処理 量 を 費やす 部 分 を 切り 分 け て いっ た 結果 , まず , 3D 


注 1: 現在 の 組み 込み シス テム 開発 で は , 3D グ ラフ ィ ッ クス は 専用 の ハ 


画 を 行う ライ ブラ リ 関数 の 性 能 が 不 十分 で あり , 最適 化 ドウ ェ ア ・ ア クセ ラレー タ を 用 いて , 大 規模 お ライ ブラ リ 環境 を 使い 
こなす の が 一 般 的 で ある . 本 文中 で 解説 し た 最適 化 の テク ニッ ク が 必 
を 行う 余地 が ある こと が 分 か っ て きま し た . また , 3D 画 ず し も その まま 使え る わけ で は な い の で , 注意 し て いた だ きた い . 


, LOAD, STORE, レジ スタ , ソフ ト ウェ ア ・ パ イプ ライ ン 
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処理 速度 較 メモ リ 使 用 量 | 


動画 デコ ー ダ 較 


300MHz 1.5K バ イト 【 


音声 エン コー ダ 較 


音声 デコ ー ダ 図 


余り 較 


図 1 組み 込み シス テム は 性 能 が 万 全 で 当たり 前 

テレ ビ 電 話 の 組み 込み ソフ ト ウェ ア の 例 . 使用 する CPU の 動作 周波 数 が 
300MHz, メモ リ ・ サ イズ が 1.5K バ イト だ と し た ら , ソフ トウ ェ ア を すべ 
て 集め た と き に この 範囲 に 収まる よう に 作ら な けれ ば な ら ない. これ が 出来 
な けれ ば 動か な い の で , 商品 価値 は ゼロ . 


ま が な いよ うに 思い ます . 
性 能 問題 , 裏 を 返せ ば いか に し て 最適 化す る か 」 と い 
う , 古く て 新しい 問題 が 今回 の テー マ で す . 


@ 性 能 は 「 当 た り 前 品質 」 

最初 に 注意 し な けれ ば な ら な い の は , 組み 込み シス テム 
に お ける 性 能 」 と は , 多く の 場合 , 備え て いて 当然 製品 
が 備え る べき 最低 限 の 品質 で ある ) と 認識 され る 性 質 の も 
の で ある と いう こと で す . 例え ば , 性 能 を 満た し て いれ ば 
1.000 万 円 で 売れ る モジ ュー ル も , 性 能 が 不 十分 な ら 500 万 
円 に も な り ま せん . それ どこ ろか , 0 円 に な りか ね ませ ん 
( 図 1). 一 般 的 な 用 語 で 言い 換え る と , 性 能 ば 魅力 的 品 
質 」 で は な く , 「 当たり 前 品質 」 で ある と いえ ます ば 2. 

ソフ トウ ェ ア は 本 来 , CPU の 動作 周波 数 と メモ リ の 大 き 
さ の 制約 を 受け る た め , 処理 速度 と メモ リ 使用 量 に は お の 
ず か ら 限界 が あり ます . この こと 自体 は パソ コン で 動く ア 
プリ ケー ショ ン ・ ソ フト ウェア な ど で も 変わ り は な い の で 
す が , パソ コン の CPU や メモ リ は 大 抵 の 場合 十分 に ある 
の で , 実際 の 開発 で シビ ア に 性 能 が 問わ れる こと は それ ほ 
ど 多 く な いよ うに 思い ます . 

し か し , 組み 込み ソフ トウ ェ ア の 開発 で は , ハー ド ウェ 
ア ・ リ ソー ス が ぎり ぎり で ある こと が ほとん ど で す . その 


注 2: JIS Z9901-1991 の 定義 に よる と , 「 当たり 前 品質 」 と は , 製品 が 当然 備 
える べき 最低 限 の 品質 で あり , 不 十分 で ある と ユー ザ に 不満 足 感 を 与 
える . 一 方 ,「 魅力 的 品質 」 と は , ユー ザ が 製品 自体 に 魅力 を 感じ 満足 
感 を 持つ 品質 を 指す . 
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図 2 最適 化 の 流れ 


最適 化す る に は , その 前 提 と し て ,「 正しく 動く 組み 込み モジ ュー ル 」 が 存在 
し な けれ ば な ら ない. そし て 最適 化 段 階 の デバ ッ グ で は , 「 正しく 動く か 」 に 
加え て ,「 速く 小さ く 作れ た か 」 を 考え る 必要 が ある . 


た め , 組み 込み ソフ トウ ェ ア ・ モ ジュ ー ル の 開発 に お いて 
は , 開発 の 最初 か ら 性 能 問題 を 意識 する 必要 が あり ます . 
最初 に 全体 の 工程 を 考え る 際 に , 最適 化 の フェ ー ズ を 設け 
る の は も ちろ ん の こと , 後 工程 で の 最適 化 が スム ー ズ に 進 
むように 考慮 し て 設計 し て お く 必要 が あり ます . 


人 @ 最適 化 は 正しく 動く の が 大 前 提 

も う 一 つ 注 意 が 必要 な の は , 最適 化 と いう の は あく まで 
ぞ 仕様 通り 正しく 動く モジ ュー ル が ある 」 こ と が 前 提 と な 
る , と いう こと で ず 図 2). つま り , 最適 化 を か ける 以前 
に , 仕様 通り 動く モジ ュー ル が 出来 上 が っ て いる 必要 が あ 
り ま す . そし て , 最適 化し た 後に も , この 品質 が 損なわ れ 
る よう な こと が あっ て は な り ま せん . た と え 処 理 速度 が 上 
が っ て も , その 代わ り に 仕様 通り 動か な がく な っ て し まっ た 
の で あれ ば , 最適 化 と は 呼べ ませ ん 単に バグ を 埋め 込ん 
だ こと に な っ て し まう ). 

従っ て , 最適 化 の た め に は , 優れ た 最適 化 設計 の 考え 方 
が 必要 な の は も ちろ ん の こと , 品質 劣化 を 防ぐ た め の 適 切 
な テス ト ・ ケ ー ス が 必要 と な り ま す . 


⑱@ ボトル ネッ ク は CPU ? それ と も メモ リタ? 
それ で は , ここ か ら 最 適 化 設計 の 考え 方 を 解説 し て いき 
ます .「 最適 化 」 と いう 言葉 は , 処理 速度 の 向上 と メモ リ 使 
用 量 の 削減 の 両方 を 意味 する も の で す が , ここ で は 主 と し 
て , 処理 速度 の 向上 に 重点 を 置い て 解説 し ます . 
最適 化 設 計 で 重要 と な る の は , ボトル ネッ ク と な る も の 
が 何 か を あらかじめ 見 抜い て お いて , その た め に 必要 な 対 
策 を あら か じ め 考 えて お く こ と で す . ボ ト ルネ ッ ク と な り 
うる も の は , 大 きく 分 ける と , 次 の 二 つ の いずれ か で す . 
1) CPU の 演算 量 
2) メモ リ の アク セス 速度 


メ ピ ア cz アル ゴリ ズム 図 


For (ユエ =0 : エ <32 : ユ ++ ) 


( 


y=Lh mac(y, c[1] , x[i] ) 


リフ ァ レ ンス ・ モ デル KK 
} 


? 図 実装 較 
図 3 重い 演算 処理 の 実装 度 方 法 が ポイ ント 
オー ディ オ 系 の コー デック な ど は , 処理 量 を 費やす 演算 部 分 を いか に し て 最 
適 化す る か が ポイ ント と な る . 例え ば , 積 和 演算 が それ に 当たる わけ だ が , 
開発 に 用 いる CPU り の アー キテ クチ ャ に 照ら し て , どの よう に 実装 する と 高 
速 に な る か を 理解 する . 


1) は 演算 処理 自体 が 多い た め に , 効率 の 悪い 命令 で 実 # 
し て いる と , 処理 速度 が 遅く な っ て し まう ケー ス で す . 具 
体 的 に は , 音声 系 の コー デック 処理 な ど で 問 題 と な り ま す . 
これ ら は , 積 和 演 算 の よう な 重い 処理 で ルー プ が 組ま れ て い 
る た め , 効率 の 悪い 命令 で 実装 し て し まう と , 無駄 な 処理 量 
が ルー プ の 回 数 分 だ け か さん で し まう こと に な り ま ポ 図 3). 

逆 に , 2) の よう に メモ リ の アク セス 速度 が ボ ト ルネ ッ ク 
に な る の は , 演算 処理 自体 の 重 さ より も , 扱う デー タ 量 が 
大 きす ぎ て メモ リ 上 に 配置 で き な い 場合 で す . これ は , 画 
像 処理 な ど で よ く ある ケー ス で す . 

この 連載 で 何 度 か 述べ て きた こと で す が , 0 
の メモ リ ( 内 部 メモ リ ) は アク セス 速度 が 速い の で す が , 
人 0 
に 配置 で きる わけ で は あり ませ ん . 画像 処理 の よう に 大 き 
な デー タ を 扱う 場合 は , それ ら を すべ て 内 部 メモ リ に 配置 
で きる わけ で は な い の で , 外部 メモ リ に 配置 する こと に な 
り ま す . し か し , 外部 メモ リ は 内 部 メ モリ に 比べ て 圧倒 的 
に アク セス 速度 が 遅い た め , これ を いか に し て 回 避 す る の 
か が 問題 と な る の で す . 

今回 は , 1) の ケー ス , すなわち CPU の 演算 量 を 削減 す 

こと に よっ て 最適 化 を 図る ケー ス に つい て , 具体 的 な 方 
針 を 述べ て いく こと に し ます . 


皿 身 


人 @ 演算 速度 の 向上 

CPU の 演算 量 が ボトル ネッ ク と な る ケー ス の 最適 化 方 針 
を , 図 4 に 示し ます . 演算 処理 が 重い わけ で すか ら , ポイ 
ント と な る の は ,「 仕様 を 満た す 機 能 の 実装 を いか に し て 


新人 技術 者 の た め の 


に ( 
ロジ カル ・ シ ン キ ング っ 


, メモ リ の 較 ! 
: 効率 的 使用 


コン パイ ル 結 果 の 上 
カス タマ イズ 較 


ハン ド ・ 
アセ ン ブ ル 較 


図 4 処理 速度 向上 の た め の ア プロ ー チ 


すべ て の 最適 化 が アセ ン ブ リ 記述 で 解決 する も の で は な い . メモ リ の 使い 方 
を 工夫 し な けれ ば な ら な いこ と も ある . アセ ン ブ リ 記述 に よる 最適 化 は , コ 
ン パ イル 結果 の 流用 か ら 始め て ハン ド ・ ア セン ブル に 移る と スム ー ズ . 


効率 の 良い 命令 に 置き 換え る の か 」 で す . その た め , 最適 
AA C 言 語 の よう な 高級 言語 で 実装 され 
< モジ ュー ル を アセ ンプ ブリ 言語 な どの 低級 言語 に 置き 換え 
て 実装 する こと が 求め られ る よう に な り ま す . 
組み 込み シス テム に お ける コン パイ ラ の 生成 効率 は 近年 
飛躍 的 に 向上 し て いま す . と は いえ , CPU の アー キテ クチ 
に よっ て は , コン パイ ラ の 生成 効率 に 限界 が ある こと が 
あり ます . その た め , プロ グラ マ が コン パイ ラ に 代わ っ て 
最適 な アセ ン ブ リ ・ コ ー ド を 書く 必要 が 生じ る こと が あり 
ます 。 


⑱ まず は コン バイ ル 結 果 の 流用 か ら 

さて , 2 
初心 者 の 場合 に は , アセ ン ブ リ 言語 で 一 か ら コ ー デ ィング 
和 和 の 日 思い ます . アセ ン ブ リ 言語 は 
言語 の よう な 高級 言語 と は コー ツク の SD 66 
り 異な り ま す . まし て や , 最近 の 組み 込み 開発 で 用 いら れ 
る CPU は , 一 昔 前 の も の と 異な り , アー キテ クチ ャ が 複 
雑 で す . 従っ て , 命令 体系 を 理解 し て 使い こなす に は , な 
か な か 敷居 が 高い 面 も ちあ る で し ょ う . 

そこ で , 初心 者 が 最適 化 実装 を こなす に 当たっ て は , ま 
ず は コン パイ ル 結 果 の 改造 か ら 着手 する こと を お 勧め し ま 
す . まず , コン パイ ラ に アセ ン ブ ル 結 果 を 生成 させ て , そ 
れ を 流用 する こと か ら 始め る の で す . そし て 慣れ て きた ら 
今度 は 一 か ら ア セン プリ 言語 で ユー ディ ング する こと に し 
ます . すなわち , 

1) C 言 語 な ど で コ ー デ ィング 
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コン パイ ル 結 果 を 図 アセ ン ブ リ 言語 で 較 
改造 較 コー ディ ング 較 


アセ ン ブ リ 言語 人 


各 オ ブ ジ ェクト 了 
を リン ク 較 


図 5 アセ ン ブ リ 言語 に よる コー ディ ング 

コン パイ ラ が 生成 する アセ ン ブ リ ・ コ ー ド の 改造 か ら 始め る . コン パイ ル 結 
果 の 流用 で は 効率 の 良い コー ド が 書け な い モ ジュ ー ル も ある の で , 一 か ら ア 
セン ブリ 言語 で 書く 必要 も 生じ る . 開発 効率 や 技術 の 習熟 度 を 考え て 工夫 す 
る と よい 。. 


2) コン パイ ル 結 果 の アセ ン ブ リ ・ コ ー ド を 改造 

3) アセ ン ブ リ 言語 で 一 か ら コ ー デ ィング 

と いう 順番 で 最適 化 を 進め て いき まず 図 5). これ は 技術 
を 順に 習得 し て いく 上 か ら も , 開発 効率 の 上 か ら も 望ま し 
いと 思い ます . も ちろ ん , 1) の 段階 で , 仕様 を 満た す よ う 
に 実装 する 必要 が ある の は 言う まで も あり ませ ん . 
初心 者 か ら 見 る と , CPU の 命令 解説 書 の 記述 か ら 最適 な 
ユー ディ ング へ と つなげ て いく の は , な か な か 難し いも の 
が ある と 思わ れ ま す . そん な と き は まず , コン パイ ル 結 果 
の アセ ンプ ブリ 言語 を 眺め て , その 無駄 な 記述 を 見 破れ る よ 
うに な る こと で , 最適 化 実装 へ の 第 1 歩 と する こと が で き 
ます 、 


⑯ コン バイ ル 結 果 の 無駄 の 見 抜き 方 
で は 次 に , コン パイ ル 結 果 の 無駄 を 見 抜く コツ に つい て 
考え ます . 
アセ ンプ ブリ 言語 に よる 最適 化 実装 と いう の は , 当然 の こ 
と な が ら 個 々 の CPU の アー キテ クチ ャ に 依存 し た も の と な 
り ま す . その た め , 個々 の 最適 化 技術 は 専門 技術 性 が 高く , 
般 論 を 述べ る に は 難し い 面 が あり ます . 
し か し ,「 コン パイ ラ が コン パイ ル し た 結果 を 流用 する 」 


注 3: 命令 体系 に よっ て は LOAD と STORE を と も に MOVE 命令 で 記述 す 
る 場合 も ある . コー ディ ング の 際 に 用 いる モニ ッ パ グ 疑似 命令 ) の 
呼び 方 は 個々 の CPU に よっ て 異な る の で 注意 し て いた だ きた い . 
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メモ リ 較 レジ スタ 群 較 


6 アセ ンプ ブリ 言語 は 演算 の 前 後に LOAD/STORE が 必要 

アセ ンプ ブリ 言語 は 高級 言語 と 違っ て , メモ リ と レジ スタ 間 で の デー タ の 移動 
を 意識 し な いと コー ディ ング で き な い . デー タ は メモ リ 上 に 存在 する の に 対 
し て , 演算 は レジ スタ 上 で 行う か ら で あ る . 


と いう 前 提 に 立て ば , その 無駄 を 省 いて 最適 化 を 図る 際 に 
は , 個々 の CPU の アー キテ クチ ャ に 依存 し な い 一 定 の コ 
ツ が 存在 し ます . 

コン パイ ル 結 果 の 無駄 を 見 抜く 方 法 と いう の は , ある 
個所 に 注目 すれ ば 実は 意外 と シン プル な も の な の で す . そ 
れ は , 
1) 余計 な LOAD/STORE 命令 を 省く 
2) ルー プ の 外 に 命令 を 追い 出す 
と いう も の で す . 順に 解説 し て いく こと に し まし ょ う . 


T 


人 @ 余計 な LOAD/STORE 命令 を 省く 
アセ ン ブ リ 言語 の よう な 低級 言語 と C 言 語 の よう な 高級 
言語 に つい て , コー ディ ング に 対す る 考え 方 の 違い を 挙げ 
れ ば きり が な いで し ょ う . し か し , 最適 化す る 際 に ポイ ン 
ト と な る の は ,「 アセ ンプ ブリ 言語 は メモ リ か ら レ ジス タ に デ 
ー タ を 移動 させ な いと 演算 で き な い 」 と いう 点 で ボ 図 6). 
デー タ は メ モリ に 格納 され て いる の に 対し て , アセ ン ブ 
リ 言語 の 演算 命令 は レジ スタ 上 で 行い ます . メモ リ か ら レ 
ジス タ に デー タ を 移動 させ る こと を LOAD, 逆 に レジ スタ 
か ら メ モリ に デー タ を 移動 させ る こと を STORE と 呼び ま 
す . アセ ンプ ブリ 言語 の ユー ディ ング で は , 必ず この LOAD 
と STORE を 演算 の 前 後 で 行っ て いま す 注 3. 従っ て , コン 
パイ ル 結 果 の 無駄 を 見 抜く 一 つ 目 の ポイ ント は , この 
LOAD/STORE に 無駄 が な いか どう か に 着目 する こと で す 
( 図 7 の . 


@ レジ スタ の 有効 活用 が 最適 化 の ポイ ント 
ここ で ,「 レジ スタ の 数 に は 上 限 が ある か ら , どん な 場 


LOAD 


図 7 演算 の 前 後 の LOAD/STORE に 着目 
レジ スタ 上 で 演算 を 続け られ る の で あれ ば , メモ リ - レ ジス タ 間 の デー タ の 
移動 は 無駄 で ある . 従っ て , 演算 の 前 後に LOADISTORE が 繰り 返さ れ て い 
れ ば , 最初 と 最後 に 1 回 ずつ LOADSTORE に まとめ れ ば すむ こと に な る 


合 で も LOAD/STORE が 省け る わけ で は な い は ず だ 」 と 気 
付い た 方 が いる か も し れ ま せん が , 全く その 通り で す . ア 
セン ブリ 言語 レベ ル で の 最適 化 と いう の は ,「 CPU の レジ 
スタ を いか に 無駄 な く 活用 する か 」 と いう こと の 裏返し で 
も ある の で す . 

メモ リ - レ ジス タ 間 の デー タ の 移動 を 削減 し て 演算 を 行え 
ば , 演算 の 途中 結果 な ど は すべ て レジ スタ に 保持 し て お か 
ね ば な ら な いこ と に な り ま す . CPU が 持っ て いる レジ スタ 
の 数 に は 上 限 が ある た め , レジ スタ の 数 が あふ れ て し まえ 
ば , それ 以上 は LOAD/STORE が 削減 で きず , メモ リ ・ 
アク セス が 必要 と いう こと に な り ま す . 従っ て , 数 に 限り 
の ある レジ スタ を うま く 使い 回 し て 余計 な LOAD/STORE 
を 演算 の 間 に 挟 まず に コー ディ ング する こと が , アセ ンプ ブ 
リ 言語 レベ ル で の 最適 化 の コツ で す . 

余計 な LOAD/STORE 命 令 を 削減 する こと は , と り も 
な お さ ず , CPU に 用 意 さ れ て いる レジ スタ を 無駄 な く 使う 
こと に つなが る , と いう こと に 注意 し て くだ さい . 


@⑯ ルー プ の 外 に 命令 を 追い 出す 

コン パイ ル 結 果 の 無駄 を 見 抜く 方 法 の 二 つ 目 は ,「 ルー 
プ の 中 に 注目 する 」 と いう こと で ず 図 8). ルー プ の 中 の 
処理 は , ルー プ の 中 の 演算 量 に ルー プ 回 数 を 掛け算 し た も 
の が 全体 の 処理 量 と な り ま す . その た め , ルー プ の 中 の 処 
理 は 削減 効果 が 高い の で , どの よう な アー キテ クチ ャ の 
CPU を 用 いて 実装 する 場合 で も , ルー プ の 中 の 処理 を いか 
に し て 減ら すか と いう の が , 最適 化 に 当たっ て は 常に ポイ 


新人 技術 者 の た め の 


ロジ カル ・ シ ン キ ング 


処理 量 は 隊 
200 200 倍 図 
ルー プ 図 


コー ド 量 図 処理 量 較 


図 8 ルー プ の 中 は 削減 効果 が 高い 

ルー プ 中 の 演算 が 20 サ イク ル あ っ た と する . ルー プ 回 数 が 200 回 な ら , そ 
の 部 分 の 処理 量 は 20 X 200= 4000 サ イク ル と な る . ルー プ 中 の 処理 は 削減 
効果 が 高い の で , 最適 化す る 際 に は まず , ルー プ の 中 に 注目 する . 


図 9 ルー プ の 中 に 注目 

コン パイ ル 結 果 の 無駄 を 見 抜く に は , ルー プ 中 の 無駄 な 命令 え ル ー プ の 外 に 
いか に し て 追い 出す か に 注目 する と よい . ルー プ の 外 で も 実装 で きる 命令 は , 
な る べく 外 に 追い 出す こと . 具体 例 を 図 10, 図 11 に 挙げ た . 


ント と な り ま ず ポ 図 9). 

ルー プ の 中 の 処理 を 工夫 に よっ て 減ら せる も の と し て は , 
例え ば , テー ブル の アド レス 計算 な ど が あり ます . テー ブ 
ル の よう に デー タ が 隣り 合わ せ に な っ て いる 場合 , デー タ 
を ルー プ の 中 で 次 々 に LOAD す る 場合 は , 
① 先頭 アド レス の LOAD 
② オフ セッ ト の 計算 
⑨③ 先頭 アド レス オフセット の 加算 
④ ⑧③ で 求め た アド レス か ら レ ジス タ へ LOAD 

と いう 一 連 の 処理 を 行う こと に な り ま す . 

コン パイ ル 結 果 を 眺め た と き , これ ら が すべ て ルー プ の 
中 で 行わ れ て いた と し た ら , 最適 化 の 余地 あり と いえ ます 
( 図 10). これ を 最適 化し た 具体 例 を 図 11 に 示し ます . 
LOAD 対象 の デー タ が 隣り 合っ て いる 事実 に 着目 する こと 
に よっ て , 最適 化 の ヒン ト が 得 ら れ ま す . 図 10 の ③ で 求 
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図 10 

最適 化 前 の アド レス 計算 

テー ブル の よう に 隣り 合わ せ の デー タ を ルー プ の 中 で 次 々 と LOAD す る 場 
合 , ① て ④ の 処理 を 順に こなす こと に な る . これ ら が すべ て ルー プ の 中 に 
あっ た ら 非 効率 的 で ある . いか に し て 最適 化す る か ? 


図 11 

最適 化 後 の アド レス 計算 

隣り 合わ せ の デー タ を 順に LOAD す る な ら , オフ セッ ト 値 は ー つ ずつ イン 
クリ メン ト ( 増分 ) すれ ば 求め られ る こと に な る . ここ に 注目 し て , ①~ て ⑤ 
の よう に 命令 を 書き 換え る . 図 10 と 比較 する と , ルー プ 中 の 命令 は 四 つ 
か ら 二 つ に 削減 され る . 


め る 先頭 アド レス オフ セッ ト と いう 値 は , LOAD の 度 に 
1 ずつ 増え て いく だ け で す . それ な ら ば , この アド レス 値 
を ルー プ の 外 で レジ スタ に 格納 し て お いて , ルー プ の 中 
で イン クリ メン ト し て いけ ば よい , と いう こと に な る で 
上 。 

図 10 と 図 11 を 見 比べ て みて くだ さい . この 工夫 で , ル 
ー プ の 中 の 命令 が 止 つ か ら 二 つ に 減り まし た 


@ 最適 化 に は CPU アー キテ クチ ャ の 理解 が 必要 
こま で , コン パイ ル 結 果 の 無駄 を 見 抜い て 改造 する 観 

002 導電 の 980 ツ グ 旨 お で きま 

し か し ,「 コン パイ ル 結 果 の 流用 」 と いう アプ ロー チ の み 
で は 限界 も あり ます . アセ ンプ ブ リ 言語 と 高級 言語 で は デー 
タ 構 造 の 持ち 方 が 根本 的 に 異な る た め , 演算 に よっ て は 
流用 が きか な いも の も ある か ら で す . 例え ば , 信号 処理 の 
フィ ル タ 演算 な ど が それ に 当たり ます . その よう な 場合 に 
は , 関数 を まる ご と 一 つ ア セン ブリ 言語 で コー ディ ング す 
る 必要 が 生じ ます . 

最適 な アセ ン ブ ル ・ コ ー ド を 書く に は , な に より も まず 
CPU アー キテ クチ ャ の 特徴 を よく 理解 する 必要 が あり ま 
す . そし て , 自分 が 実装 し よう と し て いる 演算 を 高速 化 で 
きる よう な 命令 が CPU に 用 意 さ れ て いな いか , CPU の マ 
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① 先頭 アド レス を LOAD | ② オフ セッ ト を 計算 
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オフ セッ ト を 加算 層 只 
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LoAD | 区 
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| | 9 @ の 値 を イン クリ メン ト 共 な う 
メモ リ 図 け の 
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ニュ アル を よく 読ん で 工夫 する 必要 が あり ます 

組み 込み シス テム 用 に 開発 され た CPU アー キテ クチ ャ 
は , 処理 速度 を 高め る た め に いろ いろ な 工夫 を 施し て あり 
ます . その 特徴 を 把握 する こと が 大 切 で す . 

演算 効率 を 高め る た め に CPU アー キテ クチ ャ が 採る 方 法 
は , 大 きく 分 け て 次 の 二 つ が あり まず 実際 に は , これ ら 
の 組み 合わ せ で CPU は 実装 され て いる ). 
1) ソフ ト ウェア ・ パ イプ ライ ン 

ソフ トウ ェ ア ・ パ イプ ライ ン と は , 一 連 の CPU の 命令 
を 並列 化し て , 1 サイ クル に いく つも の 命令 を 実行 で きる 
うに する こと で す . ロー ド 命令 つ 乗 算命 令 つ 加算 命令 っ 
スト ア 命 令 と いう 命令 を 繰り 返す の で あれ ば , 命令 を 一 つ 
ー つ 処理 する の で は な く , 個々 の 命令 を 並 贅 化 し て し まっ 
て 1 サイ クル で 複数 の 演算 を こなし て し まえ ば , 処理 速度 
は 向上 する こと に な り ま ず 図 12). 従っ て , コン パイ ラ 
が も し 命令 の ソフ ト ウェア ・ パ イプ ライ ン 化 を 十分 に 行っ 
て いな い の で あれ ば , プロ グラ マ が アセ ン ブ ル ・ コ ー ド を 
書き 換え る 必要 が あり ます . 
2) 専用 命令 の 実装 

専用 命令 の 実装 と は , 一 つの 演算 器 で 複数 の 命令 を 同時 
に 処理 する こと が で きる よう な 回 路 を CPU が 内 蔵 す る 場 
を 指し ます . 例え ば , 積 和 濾 を 同時 に SS 


テー 


図 12 ソフ トウ ェ ア ・ パ イプ ライ ン の 例 

LOAD, ADD, MPY, STORE と 一 つ ー つ 実行 する より も , 並列 化し て 次 々 
と 実行 し た 方 が 処理 速度 は 向上 する . 1 サイ クル に 複数 の 命令 を 実行 で きる 
機構 を 大 抵 の CPU は 持っ て いる の で , いか に し て 多く の 命令 を ソフ トウ ェ 
ア で パイ プラ イン 化 で きる か が 処理 速度 向上 の ポイ ント と な る . 


Mac 命 令 が CPU に され て いる 場合 な ど が それ に 当 た 
り ま ず 図 13). 


注意 し な けれ ば いけ な い の は , この よう な 専用 命令 が 
CPU の アー キテ クチ ャ に は 用 意 さ れ て いて も , コン パイ ラ 
は それ を 生成 し て くれ な いこ と が むしろ 多い と いう こと で 
す . その 場合 は , コン パイ ラ の 生成 コー ド と 言語 の 実装 
を よく 見 比べ て , 効率 的 な 命令 を コン パイ ラ が 期待 通り 生 
成 し て くれ て いる か を チェ ッ ク す る 必要 が あり ます . 

そし て ,「 自分 な ら こ う 書く 」 と いう コー ド を コン パイ ラ 
が 生成 し て くれ て いな い の で あれ ば , プロ グラ マ が アセ ン 
ブリ 言語 を 自分 で 書く 必要 が ある と いう こと で す . 


@ 最適 化 ノ ウ ハ ウ の 汎用 性 に つい て 

CPU の 命令 を 駆使 し て 最適 化 を 行う 知識 は , 専門 技術 性 
が 高く , 個々 の CPU に 固有 の も の と 従来 は 考え られ て き 
まし た . この こと 自体 は 否定 の 余地 が な いよ うに も 思え ま 
す . し か し , 組み 込み シス テム の 開発 環境 に お いて , 技術 
者 た ち が 培 っ て きた 技量 が 応用 の きか な いそ の 場 限り の も 
の だ , と 考え る の は いか に も も っ た いな い 気 が し ます . な 
ぜ な ら , 変化 の 激しい 組み 込み シス テム の 開発 の 現場 で は 
次 か ら 次 へ と 新しい アー キテ クチ ャ に 対応 する よう に 迫 ら 
れる こと が 多い か ら です. 

ー つ の 例 と し て , 自動 車 に 組み 込ま れる 車載 シス テム に 
つい て 考え て み ま し ょ う . 自動 車 は カー・ ス テレ オ や カ 
ー・ ナ ビ ゲ ー シ ョ ン の よう な 運転 者 の 目 に 見 える も の か ら , 
エン ジン 制御 の よう な 目 に 見 えな いも の も 含め て , 1 台 の 
車 に さま ざま な CPU が 積み 込ま れ て いま す . 現在 で は , 普 

の 車 で も 60 個 程度 , 多い も の だ と 100 個 も の CPU が 組 
み 込 まれ て いる と 言わ れ ま す . その 中 で 最適 化 が シビ ア に 
問わ れる も の が どの 程度 ある の か は 筆者 に は 分 か り ま せん 


Im 


新人 技術 者 の た め の 


図 13 専用 命令 の 例 

ー つ の 演算 回 路 が 二 つ の 積 和 算 を 一 度 に 行え る の が Dual Mac 命 令 で ある . 
この よう な 専用 命令 は , 使え る レジ スタ や メモ リ に 制限 が ある こと が 多い の 
で , 制約 を 満た す よ うに アセ ン ブ リ 言語 を 書く こと . また , そもそも この 命 
令 を コン パイ ラ が 生成 し て く れ な いこ と も し ば し ば ある . 


が , それ ぞ れ が エキ スパ ー ト の み が 知 る 世界 で , 相互 に 連 
絡 が あり 得 な いと し た ら , 寂し い 限 り の よう な 気 が し ます . 

技術 者 が 自分 の 専門 性 を 深め る こと は 非常 に 重要 で す . 
し か し 同時 に , 自分 の 技術 が どの 程度 の 汎用 性 を 持ち える 
の か を 考え る こと も 時 に は 必要 だ と 思い ます . 
テラ ン ・ エ ンジ ニア で も , 自分 が 長年 親しん で きた アー キ 
テク チャ が , 気が付い た ら お 払い 箱 に な っ て いる こと も あ 
る か も し れ ま せん . そう で な く て も , や が て は 管理 者 と し 
て 後進 の 指導 に 当たら な けれ ば な ら な いと き に , 自分 の 経 
験 し た こと だ け に 閉じ た 昔話 し か で き な い の だ と し た ら , 
開発 現場 の 足 を ひっ ぱる こと に な る で し ょ う . 

最適 化 の よう に , 一 見 応用 の きか な い 実 装 依存 の 知識 で 
あっ て も , 汎用 化 さ せる と し た ら ど の よう な こと が 考え ら 
れる の か を 問う て みる の は , 重要 で ある よう に 思い ます . 


誇り 高き べ 
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筆者 プロ フィ ー ル ツ 
済 木 元 . システム ・ エ ンジ ニア .「 ゴル フ の スイ ング を し な が ら 
し ゃ べ る サラ リー マン 」 と いう の は , ある 種 典型 的 な 行動 パタ ー 
ン と 思わ れる の だ が , な ぜ か 筆者 の 周囲 で は お 目 に か か る こと が 
少な い . ゴル フ を し な い の は 単に 金 が も っ た いな いか ら か ? 世 の 
中 に ば ゴル フ を する と ころ を 見 れ ば 人 間 が 分 か る 」 と 言う 人 すら 
いる らし い の だ が , いっ た い 彼 ら は , 何 を 見 て そう 言っ て いる の 
だ ろう ? 
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